第十一篇: RAG 基本概念 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2024 iThome 鐵人賽

DAY 11

1

Kubernetes

成為 Kubernetes 特級咒術師的 30 天修行系列第 11 篇

第十一篇: RAG 基本概念

16th鐵人賽

團隊NUTC-IMAC-MASTER-24

2024-09-12 06:38:51

145 瀏覽

分享至

前言

在認識了 Kubernetes 的基本概念後，我們將深入探討如何在 Kubernetes 部署現代自然語言處理（Natural Language Processing, NLP）技術。在 NLP 領域，大型語言模型（Large Language Models, LLM）和檢索增強生成（Retrieval-Augmented Generation, RAG）是兩個重要的技術概念。

什麼是 LLM ?

大型語言模型（LLM）是一種基於深度學習技術的自然語言處理模型，具有數十億甚至數千億個參數。LLM 通過對海量文本的訓練，學習語言的統計規律和語意結構以執行多種 NLP 任務，例如文本生成或問答等。

然而，儘管 LLM 展現出強大的語言理解和生成能力，LLM 仍存在一些限制，像是生成內容可能缺乏精確性，特別是在涉及具體事實或專業知識相關的任務時，容易出現錯誤或偏差。

什麼是 RAG ?

檢索增強生成（RAG）是一種將檢索技術與生成模型結合的自然語言處理框架。在 LLM 生成回覆之前，先從外部的資料庫「檢索」相關資料，然後利用這些檢索結果供給 LLM 參考並「生成」回覆。這種結合方式可以顯著提升生成內容的精確性和相關性，特別是在需要準確回應具體問題或引用外部知識的情境下。

RAG 結合了檢索和生成的優點，既保留了 LLM 的靈活性和創造力，又提升了生成內容的準確性和專業性。這使得 RAG 特別適合應用於需要引用大量知識或提供精確資訊的場景，如問答系統、知識庫查詢、專業領域的文本生成等。

第十篇: NetworkPolicy 與 Namespace

第十二篇：RAG 的技術架構

系列文

成為 Kubernetes 特級咒術師的 30 天修行共 30 篇

目錄

RSS系列文訂閱系列文

6 人訂閱

完整目錄

直播研討會

{{ item.subject }}

{{ item.channelVendor }} {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22202 篇

完賽人數

602 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙